声学和视觉感测可以在人操纵时支持容器重量和其内容量的非接触式估计。但是,Opaquent和透明度(包括容器和内容的透明度)以及材料,形状和尺寸的可变性都会使这个问题具有挑战性。在本文中,我们向基准方法提出了一个开放框架,用于估计容器的容量,以及其内容的类型,质量和量。该框架包括数据集,明确定义的任务和性能测量,基线和最先进的方法,以及对这些方法的深入比较分析。使用单独的音频或音频和视觉数据的组合使用具有音频的神经网络的深度学习,用于分类内容的类型和数量,无论是独立的还是共同。具有视觉数据的回归和几何方法是优选的,以确定容器的容量。结果表明,使用仅使用Audio作为输入模块的方法对内容类型和级别进行分类,可分别获得加权平均F1-得分高达81%和97%。估计仅具有视觉视觉的近似接近和填充质量的容器容量,具有视听,多级算法达到65%的加权平均容量和质量分数。
translated by 谷歌翻译
We present a lightweight post-processing method to refine the semantic segmentation results of point cloud sequences. Most existing methods usually segment frame by frame and encounter the inherent ambiguity of the problem: based on a measurement in a single frame, labels are sometimes difficult to predict even for humans. To remedy this problem, we propose to explicitly train a network to refine these results predicted by an existing segmentation method. The network, which we call the P2Net, learns the consistency constraints between coincident points from consecutive frames after registration. We evaluate the proposed post-processing method both qualitatively and quantitatively on the SemanticKITTI dataset that consists of real outdoor scenes. The effectiveness of the proposed method is validated by comparing the results predicted by two representative networks with and without the refinement by the post-processing network. Specifically, qualitative visualization validates the key idea that labels of the points that are difficult to predict can be corrected with P2Net. Quantitatively, overall mIoU is improved from 10.5% to 11.7% for PointNet [1] and from 10.8% to 15.9% for PointNet++ [2].
translated by 谷歌翻译
The preservation, monitoring, and control of water resources has been a major challenge in recent decades. Water resources must be constantly monitored to know the contamination levels of water. To meet this objective, this paper proposes a water monitoring system using autonomous surface vehicles, equipped with water quality sensors, based on a multimodal particle swarm optimization, and the federated learning technique, with Gaussian process as a surrogate model, the AquaFeL-PSO algorithm. The proposed monitoring system has two phases, the exploration phase and the exploitation phase. In the exploration phase, the vehicles examine the surface of the water resource, and with the data acquired by the water quality sensors, a first water quality model is estimated in the central server. In the exploitation phase, the area is divided into action zones using the model estimated in the exploration phase for a better exploitation of the contamination zones. To obtain the final water quality model of the water resource, the models obtained in both phases are combined. The results demonstrate the efficiency of the proposed path planner in obtaining water quality models of the pollution zones, with a 14$\%$ improvement over the other path planners compared, and the entire water resource, obtaining a 400$\%$ better model, as well as in detecting pollution peaks, the improvement in this case study is 4,000$\%$. It was also proven that the results obtained by applying the federated learning technique are very similar to the results of a centralized system.
translated by 谷歌翻译
针对目标的对话任务的先前研究缺乏关键观念,该观念在以目标为导向的人工智能代理的背景下进行了深入研究。在这项研究中,我们提出了目标引导的开放域对话计划(TGCP)任务的任务,以评估神经对话代理是否具有目标对话计划的能力。使用TGCP任务,我们研究了现有检索模型和最新强生成模型的对话计划能力。实验结果揭示了当前技术面临的挑战。
translated by 谷歌翻译
最近,在线广告客户使用推荐系统(RSS)来显示广告来改善用户的参与度。上下文强盗模型是一种广泛使用的RS,可利用和探索用户的参与度并最大化长期奖励,例如点击或转换。但是,当前的模型旨在仅在特定域中优化一组广告,并且不与多个域中的其他模型共享信息。在本文中,我们提出了动态协作过滤汤普森采样(DCTS),这是新颖而简单的模型,以在多个强盗模型之间传递知识。 DCT利用用户和广告之间的相似性来估计汤普森采样的先前分布。这种相似性是根据用户和广告的上下文功能获得的。相似性使模型在没有太多数据的域中通过传输知识来更快地收敛。此外,DCT结合了用户的时间动态,以跟踪用户最近的偏好变化。我们首先显示传递知识并结合时间动力学改善了合成数据集上基线模型的性能。然后,我们对现实世界数据集进行了经验分析,结果表明,与最先进的模型相比,DCTS的点击率提高了9.7%。我们还分析了调整时间动力学和相似性的超参数,并显示最大化CTR的最佳参数。
translated by 谷歌翻译
避免产生与先前环境相矛盾的响应是对话响应产生的重大挑战。一种可行的方法是后处理,例如从最终的n-最佳响应列表中滤除矛盾的响应。在这种情况下,n-最佳列表的质量极大地影响了矛盾的发生,因为最终响应是从该最佳列表中选择的。这项研究定量地分析了使用N最佳列表的一致性对神经反应产生模型的上下文矛盾意识。特别是,我们将极性问题用作简洁和定量分析的刺激输入。我们的测试说明了最近的神经反应产生模型和方法的矛盾意识,然后讨论了它们的性质和局限性。
translated by 谷歌翻译
我们引入了责任感敏感安全性(RSS)的目标延长,这是一种基于规则的自动驾驶系统安全保证(ADS)的方法。制定RSS规则保证目标实现 - 除了原始RSS中的避免碰撞外,还需要进行长时间的操纵序列的复杂计划。为了应对复杂性,我们基于程序逻辑引入了一个构图推理框架,其中可以系统地为较小的子赛车制定RSS规则,并将它们组合起来以获取用于较大场景的RSS规则。作为框架的基础,我们介绍了一个程序逻辑DFHL,可满足连续的动态和安全条件。我们的框架介绍了基于DFHL的工作流程,用于导出目标感知RSS规则;我们也讨论其软件支持。我们在安全体系结构中使用RSS规则进行了实验评估。它的结果表明,目标感知RSS确实有效地实现了避免碰撞和目标实现目标。
translated by 谷歌翻译
自组织的聚合是群体机器人技术的一种精心研究的行为,因为它是开发更先进的组级响应的前提。在本文中,我们研究了分散算法的设计,用于在不同的目标位点上自我聚集的一群异质机器人。先前的研究表明,包括作为群体的一部分,许多知情的机器人可以将聚合过程的动态引导到可用聚合位点之间群体的理想分布。我们使用简化的方法复制了先前研究的结果:我们删除了与机器人的通信协议相关的约束,并简化了调节概率控制器状态之间过渡的控制机制。结果表明,可以使用我们的简化方法来复制以先前,更复杂的控制器获得的性能,该方法在物理机器人的便携性和灵活性方面具有明显的优势。也就是说,与复杂控制器相比,我们简化的方法可以在更大的操作条件下产生自组织的聚合响应。
translated by 谷歌翻译
医疗AI通过支持基于证据的医学实践,个性化患者治疗,降低成本以及改善提供者和患者体验,推进医疗保健的巨大潜力。我们认为解锁此潜力需要一种系统的方法来衡量在大规模异构数据上的医疗AI模型的性能。为了满足这种需求,我们正在建立Medperf,这是一个开放的框架,用于在医疗领域的基准测试机器学习。 Medperf将使联合评估能够将模型安全地分配给不同的评估设施,从而赋予医疗组织在高效和人类监督过程中评估和验证AI模型的性能,同时优先考虑隐私。我们描述了当前的挑战医疗保健和AI社区面临,需要开放平台,Medperf的设计理念,其目前的实施状态和我们的路线图。我们呼吁研究人员和组织加入我们创建Medperf开放基准平台。
translated by 谷歌翻译
近年来,使用人工智能创造了广泛的投资模式。人工智能自动交易可以扩大交易方式的范围,例如通过授权每天24小时运行的能力以及以高频交易的能力。如果可以充分考虑过去的数据,也可以预期自动交易比使用更多信息交易。在本文中,我们提出了一种基于深度加强学习模型的投资代理,这是一个人工智能模型。该模型考虑了实际交易中涉及的交易成本,并在很长一段时间内创建交易的框架,以便它可以在单一贸易上进行大量利润。在这样做时,它可以最大限度地提高利润,同时保持交易成本低。此外,考虑到实际操作,我们使用在线学习,以便系统可以通过不断更新最新的在线数据而不是使用静态数据来继续学习。这使得可以通过始终纳入当前的市场趋势信息来贸易非静止金融市场。
translated by 谷歌翻译